搞懂 Transformer 的三件事:它为啥牛、怎么牛、牛在哪用
Self-Attention、多头机制、位置编码……别急着头大。这篇文章不会用术语“堆你一脸”,而是像讲故事一样,用“分水果”“看队伍”这些日常场景,带你10分钟读懂 Transformer 的底层逻辑。到底它怎么成了 GPT、BERT 背后的技术支柱?看完你
gpt transformer rnn 并行处理 bert 2025-09-15 18:14 14
Self-Attention、多头机制、位置编码……别急着头大。这篇文章不会用术语“堆你一脸”,而是像讲故事一样,用“分水果”“看队伍”这些日常场景,带你10分钟读懂 Transformer 的底层逻辑。到底它怎么成了 GPT、BERT 背后的技术支柱?看完你
gpt transformer rnn 并行处理 bert 2025-09-15 18:14 14
Transformer横空出世,并迅速推广后,不少人开始质疑:这玩意到底是不是被神化了?它是不是只是算得快?真的理解语言吗?还是说它只是大数据堆出来的“统计机器”?
模型 transformer 语 transformer困惑 2025-09-15 19:41 7
Transformer,这一AI领域的“超级英雄”,正在重新定义人工智能的未来。Transformer为何被称为颠覆性技术?它如何突破AI发展的核心瓶颈?
模型 transformer rnn 危机 传统 2025-09-15 14:32 9
最近,来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现:在心算任务中,几乎所有实际的数学计算都集中在序列的最后一个token上完成,而不是分散在所有token中。
transformer 数学题 token af1 llam 2025-09-14 13:37 12
Self-Attention、位置编码、多头机制……别被这些黑话吓退!这篇用“分水果”“传纸条”就能秒懂的比喻,把 Transformer 拆成一条流水线:谁负责查字典、谁负责排队、谁负责打包,十分钟让你明白大模型为什么能“一眼看完一句话”。看完不再只是调包,
模型 gpt transformer rnn 并行处理 2025-09-13 14:42 11
AGI真正降临那天,人类意识上传终获「数字永生」!它将模拟大脑每一次脉冲,预测世界每一种变迁,甚至重构灵魂本质。新智元十周年峰会上,清华刘嘉教授带来了一场思想盛宴。他从脑科学角度,深入解析AGI如何突破生物桎梏,开启无限的可能。
数字 清华 transformer 刘嘉 清华刘嘉 2025-09-13 13:07 11
说这句话的不是别人,是大名鼎鼎的Transformer发明者——Ashish Vaswani。
openai transformer 2025-09-12 11:01 17
9月8日,2025年慕尼黑车展 (IAA MOBILITY) 正式拉开帷幕。中国智驾科技领军企业地平线携多项最新全球化合作成果亮相本届车展,其与全球领先的汽车技术与服务供应商博世的多项合作成果迎来重要进展。目前,双方基于地平线征程6系列打造的博世纵横辅助驾驶升
transformer 博世 车企 样件 搜狐汽车 2025-09-11 15:39 10
博世基于地平线征程6E/M研发的纵横辅助驾驶升级版,算力可达80TOPS或128TOPS,深度融合BEV Transformer与占用网络感知算法,在多种复杂场景下实现更精准、更可靠的高阶辅助驾驶功能。
transformer 慕尼黑 车展 博世 hsd 2025-09-10 17:49 8
9月5日,中国科学院自动化研究所发布了类脑脉冲大模型“瞬悉1.0”(SpikingBrain-1.0)的技术报告。SpikingBrain-7B开源模型仅用主流大模型2%的预训练数据,就实现了Qwen2.5-7B 90%的性能,并与Llama-3.1-8B等众
训练 模型 transformer gpu spikingb 2025-09-10 19:39 11
人工智能的学习路径是一条从“基础算法”逐渐迈向“复杂网络”的进阶之路。在这个过程中,机器学习与深度学习无疑是最重要的两个里程碑。机器学习让计算机具备了“从数据中总结规律”的能力,而深度学习则通过神经网络的多层抽象,极大提升了人工智能的表达与认知能力。
学习 机器学习 transformer rnn 深度学习 2025-09-10 17:31 8
9月8日,2025年慕尼黑车展(IAA MOBILITY)正式拉开帷幕。中国智驾科技领军企业地平线携多项最新全球化合作成果亮相本届车展,其与全球领先的汽车技术与服务供应商博世的多项合作成果迎来重要进展。目前,双方基于地平线征程6系列打造的博世纵横辅助驾驶升级版
transformer 车展 博世 车企 样件 2025-09-10 14:19 16
他与大家分享的主题是:“ParticleFormer - 基于Transformer的3D点云世界模型”,届时他将介绍ParticleFormer,一种基于 Transformer 的点云世界模型。相关工作已入选CoRL 2025。
transformer 斯坦福大学 点云 particlef 2025-09-09 17:30 10
高光谱图像超分辨率技术旨在通过提升低分辨率高光谱图像的空间细节和质量,使其更好地服务于环境监测等领域。近年来,基于深度卷积神经网络的机器学习技术在光谱单图超分辨率领域上有着广泛的发展与应用,但仍存在难以兼顾空间多尺度局部特征与全局细节特征学习的缺陷。对此,本文
transformer cnn 高光谱 程青 高光谱图像 2025-09-09 23:55 11
人工智能正在引发数据中心历史上最大规模的基础设施革命。谷歌Gemini工程副总裁、Transformer模型联合发明人Noam Shazeer在最近的Hot Chips大会上明确指出,大语言模型的发展需要更多计算能力、更大内存容量、更高网络带宽,这一判断正在推
transformer 人工智 transformer创始人 2025-09-09 18:59 13
9月8日,2025年慕尼黑车展 (IAA MOBILITY) 正式拉开帷幕。中国智驾科技领军企业地平线携多项最新全球化合作成果亮相本届车展,其与全球领先的汽车技术与服务供应商博世的多项合作成果迎来重要进展。目前,双方基于地平线征程6系列打造的博世纵横辅助驾驶升
transformer 车展 博世 纳什 样件 2025-09-09 18:03 11
在最近的Hot Chips大会上,谷歌 Gemini 的工程副总裁Noam Shazeer发表了题为“人工智能下一阶段的预测”的演讲。自 2017 年发明 Transformer 模型以来,他已在 LLM 领域耕耘十年。正如他的幻灯片所述,LLM 可以利用硬件
模型 transformer 发明人 2025-09-09 09:11 13
SpikingBrain借鉴大脑信息处理机制,具有线性/近线性复杂度,在超长序列上具有显著速度优势,在GPU上1M长度下TTFT 速度相比主流大模型提升26.5x, 4M长度下保守估计速度提升超过100x;在手机CPU端64k-128k-256k长度下较Lla
模型 中国科学院 transformer gpu moe 2025-09-08 20:29 10
该作品借助AI创作工具制作而成,聚焦在“十四五”规划期间,广晟有色所属兴邦公司以“小改小革”推动稀土产业高质量发展的生动故事。以第三代皂化技术、连续酸溶平台、高纯钇制备、错峰节能降耗策略等实际案例,充分运用Transformer架构NLU、GAN与扩散模型融合
gpt transformer 视界 央企 稀土产业 2025-09-08 19:51 10
2025年的科技圈,要说谁是顶流,深度学习绝对算一个。它不再是实验室里高冷的学术名词,而是像空气和水一样,正以惊人的速度渗透到我们生活的方方面面,改变着全球各行各业的玩法。这股浪潮由更强的算力、更聪明的算法和海量的数据共同掀起,已经从一个小众研究领域,成长为商
transformer 深度学习 transformer架构 2025-09-08 17:40 11